Identificación Automática del Idioma en Twitter: Adaptación de Identificadores del Estado del Arte al Contexto Ibérico

نویسندگان

  • Yerai Doval
  • David Vilares
  • Jesús Vilares
چکیده

We describe here our partipation in TweetLID. After having studied the problem of language identification, the resources available, and designed a text conflation approach for this kind of tasks, we joined the competition with two systems: the first one was based in the guesser langdetect, re-trained and adapted in order to work with conflated text; the second one was an approach based on majority vote which used a set of re-trained and adapted classifiers. Results are analized both globally and at language and tweet-type levels.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Identificación de un Sistema de Fijación de Tornillos con Ruido en Mediciones

Resumen La identificación de sistemas es una tarea anterior fundamental al control de los mismos. El estado del arte en la identificación ha permitido resolver el problema de conocer el modelo de los sistemas con alta precisión, considerando que las mediciones de las variables del sistema son realizadas sin error; o bien, efectuando algún tratamiento de filtrado. Sin embargo, existen casos dond...

متن کامل

Tradução E Adaptação Para a Língua Portuguesa Do In-hospital Utstein Style Traducción Y Adaptación Al Idioma Portugués Del Instrumento In-hospital Utstein Style

RESUMEN El paro cardiopulmonar (PCP) es un estado potencialmente letal, donde la calidad del servicio depende de la agilidad, conocimiento y habilidad del equipo involucrado. El In-hospital Utstein Style fue elaborado en 1997. Este instrumento que recolecta datos de importancia durante un PCP fue traducido y adaptado al portugués. De esta forma fue sometido al proceso de traducción y adaptación...

متن کامل

Clasificación automática de la orientación semántica de opiniones mediante características lingüísticas

Resumen. En este trabajo examinamos el problema de clasificar la orientación semántica de opiniones de productos comerciales, en idioma Español. Exploramos las características de la colección de opiniones extraídas de Internet y estudiamos el uso de bigramas de afirmación como características de entrenamiento para un método supervisado. Analizamos la combinación de estas características y medim...

متن کامل

Generación Automática de Restricciones de Integridad: Estado del Arte

Resumen La aparición de la MDA (Model-Driven Architecture) y, en general, del MDD (ModelDriven Development) ha dado un nuevo impulso a la investigación acerca de la generación automática del código de una aplicación a partir de su especificación. En este artículo se estudia el soporte ofrecido por los métodos y herramientas actuales para la generación automática de las restricciones de integrid...

متن کامل

Extracción de contextos definitorios en textos de especialidad a partir del reconocimiento de patrones lingüísticos

La extracción automática de definiciones a partir de textos de especialidad es una tarea cada vez más demandante para diferentes aplicaciones del Procesamiento de Lenguaje Natural, tales como lexicografía computacional, extracción de información, semántica computacional, sistemas preguntarespuesta, minería de textos, Web semántica y aprendizaje automático. Este artículo presenta un panorama de ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014